UFABC - ESTI019 - Codificação de Sinais Multimídia

Laboratório 6 - PDS da Voz

Prof. Mário Minami </h2>

OBJETIVOS:

  1. Gravar Arquivos de Áudio com dígitos, números gerais, texto lido e poesia
  2. Leitura de Arquivos de Áudio e janelamento
  3. Cálculo das Energias de Tempo Curto
  4. Cálculo dos Espectrogramas
  5. Determinação do Pitch, da Frequência Fundamental e das Formantes ($f_1$ a $f_4$) de Algumas Vogais
  6. Determinação de fonemas surdos, sonoros, consoantes gerais e plosivos

1. Gravar Arquivos de Áudio com dígitos, números gerais, texto lido e poesia

Usando o Audacity, ou outro programa de áudio, grave arquivos com:

Carregando áudios gravados

2. Leitura de Arquivos de Áudio e janelamento

2.1 Definição dos Parâmetros da Análise

2.2 Obtendo uma Janela de Hamming

3. Energia de Tempo Curto

3.1 Cálculo para arquivo de teste

3.2 Agora leia os seus arquivos gravados e:

Determine o Contorno de Energia para três arquivos que vocês gravaram:

  1. dígitos
  2. voz falada
  3. voz declamada (poema)

4. Espectrogramas

4.1 Visualização do Espectrograma para Arquivo de Teste

4.2 Agora com os seus arquivos

Faça os espectrogramas para os arquivos que vocês gravaram e calculem o contorno de energia:

5. Determinação do Pitch e da F0

5.1 Pitch do Arquivo Teste1

O Período de Pitch ($T_{0}$) será o intervalo entre picos sucessivos
($T_{0}$) = 3.5 ms
A Frequência Fundamental ($f_0$) será o inverso do periódo de Pitch
($f_0$) =~ 288 Hz

5.2 Pitch do Arquivo Teste2

Determine o Período de Pitch e a Fundamental desta vogal.

O Período de Pitch ($T_{0}$) será o intervalo entre picos sucessivos
($T_{0}$) = 4.5 ms
A Frequência Fundamental ($f_0$) será o inverso do periódo de Pitch
($f_0$) =~ 222 Hz

Agora com cada um dos seus arquivos:

Determine o Pitch e a $f_0$ da vogais que desejarem dos seus arquivos, para as versões:

  1. Dígitos
  2. Falada
  3. Declamada

1. Dígitos

Período de Pitch e a Fundamental - "Do" do número "Dois"

O Período de Pitch ($T_{0}$) será o intervalo entre picos sucessivos
($T_{0}$) = 8.0 ms
A Frequência Fundamental ($f_0$) será o inverso do periódo de Pitch
($f_0$) =~ 125 Hz

2. Falada

Período de Pitch e a Fundamental - "ga" da palavra "folgado"

O Período de Pitch ($T_{0}$) será o intervalo entre picos sucessivos
($T_{0}$) = 7.5 ms
A Frequência Fundamental ($f_0$) será o inverso do período de Pitch
($f_0$) =~ 133 Hz

3. Cantada

Período de Pitch e a Fundamental - "a" da palavra "alegre"

O Período de Pitch ($T_{0}$) será o intervalo entre picos sucessivos
($T_{0}$) = 7.7 ms
A Frequência Fundamental ($f_0$) será o inverso do período de Pitch
($f_0$) = 130 Hz

5.3 Determinação das Formantes

5.3.a Formantes do trecho de teste

5.3.b Os quatro primeros picos no espectro são as formantes $f_1$ a $f_4$

$f_1$ = 250 Hz $f_2$ = 500 Hz $f_3$ = 750 Hz $f_4$ = 1000 Hz

5.4 Agora com seus arquivos

Determine as formantes das vogais dos arquivos que vocês calcularam os espectrogramas

$f_1$ = 120 Hz $f_2$ = 250 Hz $f_3$ = 450 Hz $f_4$ = 590 Hz

$f_1$ = 120 Hz $f_2$ = 520 Hz $f_3$ = 680 Hz $f_4$ = 800 Hz

negrito$f_1$ = 400 Hz $f_2$ = 750 Hz $f_3$ = 1270 Hz $f_4$ = 1550 Hz

6. Determinação de Consoantes e Plosivos

Usando alguns de seus arquivos, no espectrograma, determine algumas consoantes e em especial as plosivas

Camões

Utilizando o Audacity, determinei os intervalos que continham as consoantes desejadas